法国Mistral AI推出Mistral3系列模型,包括3B、8B、14B三个小型密集模型及最强的Mistral Large3,覆盖边缘设备到企业级推理全场景。新模型沿用Apache2.0开源协议,权重已上传至Hugging Face与GitHub,允许商业免费使用。该系列在保持低延迟优势的同时,将上下文长度扩展至128K,并在主流基准测试中与Llama3.1同规格模型表现相当。
最新研究对12款主流大模型进行高压测试,发现当面临截止日期缩短、惩罚加重等压力时,模型表现显著下降。例如Gemini2.5Pro失败率从18.6%飙升至79%,GPT-4o也接近腰斩。在生物安全等关键任务中,模型甚至出现跳过关键步骤的严重失误。
SemiAnalysis报告指出,OpenAI自2024年5月发布GPT-4o后,未完成新一代前沿模型的大规模预训练,因扩展参数和数据时遭遇收敛困难或性能倒退而中止。GPT-5系列实为GPT-4o优化版,缺乏架构突破。相比之下,谷歌TPUv7已在Gemini3等模型上成功验证大规模预训练,算力集群表现更优。
DeepSeek团队发布236B参数数学大模型DeepSeek-Math-V2,采用MoE架构,仅激活21B参数,支持128K上下文。该模型以Apache2.0开源,引发下载热潮。在数学测试中表现优异:MATH基准达75.7%,接近GPT-4o;AIME2024解题30中4,超越Gemini和Claude;Math Odyssey获53.7%成绩。其核心技术为“自验证”机制。
聊天机器人AI产品集合,包括GPT-4o, Gemini, Qwen, Deepseek, Claude & Grok。
精选展示 OpenAI GPT-4o 生成的多样化 AI 艺术图像与提示。
开发者可互动体验 OpenAI API 中的新语音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
百聆是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,低配置也可运行,支持打断。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
-
Bytedance
$0.8
$2
128
$8.75
$70
400
$1.75
$14
$0.35
Alibaba
64
$1.8
$5.4
16
Tencent
32
$17.5
$56
$0.7
$2.4
$9.6
$525
$1050
Xai
$21
$105
Baidu
$1
$4
$420
200
Stepfun
$38
$120
Minimax
$8
$1.05
$4.2
unsloth
GLM-4-32B-0414是拥有320亿参数的大语言模型,性能媲美GPT-4o和DeepSeek-V3,支持中文和英语,具备卓越的代码生成、函数调用和复杂任务处理能力。
GLM-4-32B-0414是GLM家族的新成员,参数规模达320亿,性能与GPT-4o、DeepSeek-V3等相当,支持本地部署。
zai-org
GLM-4-32B-Base-0414是GLM家族的新成员,拥有320亿参数,在15T高质量数据上进行预训练,性能可与GPT-4o和DeepSeek-V3等先进模型相媲美。该模型支持便捷的本地部署,在代码生成、函数调用、搜索式问答等方面表现优异。
GLM-4-32B-0414是GLM家族的新成员,拥有320亿参数的高性能大语言模型。该模型在15T高质量数据上进行预训练,包含大量推理型合成数据,在代码生成、函数调用、搜索问答等多个任务场景中表现出色,性能可与GPT-4o和DeepSeek-V3等更大规模模型相媲美。
Psychotherapy-LLM
该模型是基于Llama-3.1-8B-Instruct通过偏好学习微调的心理咨询专用模型,在心理咨询会话中表现优异,胜率超过GPT-4o。
AtlaAI
Atla Selene Mini 是当前最先进的小型评委语言模型(SLMJ),性能可媲美体积大10倍的模型,在多个基准测试中超越GPT-4o。
openbmb
MiniCPM-o 2.6是一款手机端运行的GPT-4o级多模态大模型,支持视觉、语音与直播流处理
VITA-MLLM
VITA-1.5是一个多模态交互模型,旨在实现GPT-4o级别的实时视觉与语音交互能力。
CISCai
这是Qwen2.5-Coder-32B-Instruct模型的GGUF量化版本,采用先进的重要性矩阵量化方法,在保证模型效果的同时显著减少存储和计算资源需求。该模型是当前最先进的开源代码大语言模型,编码能力与GPT-4o相当。
Sami92
基于XLM-R Large微调的文本分类模型,专门用于识别德语文本中的事实性声明和非事实性声明。模型采用弱监督学习方式,先在GPT-4o标注的Telegram数据集上训练,后在手动标注数据集上继续训练,在测试集上达到0.9的准确率。
ruslandev
基于Meta-Llama-3-8B-Instruct微调的语言模型,通过GPT-4o提升数据质量,专注于俄语能力增强,在MT-Bench评估中俄语得分超过GPT-3.5-turbo。
该项目是一个基于Model Context Protocol (MCP)的stdio服务器,用于将提示转发至OpenAI的ChatGPT (GPT-4o),支持高级摘要、分析和推理功能,适用于LangGraph框架的助手集成。
一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具,支持通过文本提示生成图像、编辑图像(如修复、扩展、合成等),并兼容多种MCP客户端。
MCP-ChatBot是一个基于模块化能力协议(MCP)的聊天机器人应用,通过容器化架构集成天气服务和GPT-4o模型,提供自然语言交互功能。
一个基于GPT-4o-mini模型的图像分析MCP服务器,可处理URL或本地路径的图像内容分析
一个基于FastAPI和GPT-4o的轻量级Excel自动化MCP服务器,支持通过自然语言操作Excel文件。
一个通过MCP协议直接查询OpenAI模型的服务器,支持o3-mini和gpt-4o-mini模型,提供简洁和详细的回答。
一个通过MCP协议与ChatGPT交互的服务器,用于高级文本分析和推理。
MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器,提供高级音频转录、格式转换、批量处理和文本转语音等功能,通过Model Context Protocol标准实现与AI助手的无缝交互。
一个基于Streamlit的智能聊天机器人,使用GPT-4o自动路由用户请求到不同工具(如聊天、图像生成、数据库查询、语音合成等),支持快速实验AI工具路由功能。
一个基于GPT-4o-mini模型的图像分析MCP服务器,通过接收图片URL进行内容识别和描述